查看原文
其他

多因素ANOVA=好几个单因素ANOVA?可没这么简单!| 协和八

2016-12-15 张之昊 协和八

说人话的统计学

在上一集《没听说过多因素 ANOVA ?那你就可就 OUT 了!》里,我们为大家初步介绍了多因素 ANOVA(方差分析)的方法。不知道你意识到没有,相比起之前我们讲过的 t 检验和单因素 ANOVA,多因素 ANOVA 为我们打开了一片广阔的新天地。为什么这么说呢?

在 t 检验和单因素 ANOVA 里,不管我们是比较几组数据的平均值,我们考虑的都只是一个因素

如果我们用独立样本 t 检验比较男性和女性,这个因素就是「性别」;

又或者我们用成对样本 t 检验比较药物组和安慰剂组,这个因素则是「用药」或者「实验处理」;

如果我们用单因素 ANOVA 比较食堂里三位师傅做出来的包子,这个因素就是「师傅」。

但是呢,一来,大千世界纷繁复杂,往往有不止一个因素影响某个结果;二来,在科研实践里,我们往往同时对不止一个因素感兴趣,或者有些因素由于客观条件所限我们无法完全控制住。这时,只能管一个因素的统计学检验就有点儿不够用了。

你也许会问,那我把 t 检验或者单因素 ANOVA 分别对每个因素都用一遍不行吗?

这个问题问得很好(先不要往下看,你知道这个问题的答案吗?)。

而一旦我们同时考虑不止一个因素,这些因素之间就还会有相互影响的可能性——这就是多因素 ANOVA(以及我们以后会讲到的其他用于分析多个因素的统计方法)中的「交互效应」的意义所在。要把多因素 ANOVA 用好,至关重要的一点就是得把交互效应的含义理解清楚。

在今天的文章里,我们就来把这个问题仔细地挖一挖。

◆◆◆

交互效应到底是什么?

上一集里我们讲到,交互效应是相对于主效应来说的。所谓主效应,就是各个因素自己在不考虑别的因素情况下对因变量 y 的影响。在此基础上,交互效应可以有两种解释:

一种是说两个因素的共同效应不等于各自单独的作用(各自的主效应)的简单相加,换言之,「一加一不等于二」;

第二种解释则是,一个因素的效应取决于另一个因素,也就是说,前者起到什么作用还要看后者的「眼色」。

听起来好像有些复杂,其实我们在日常生活中这样的情形实在是太多了。比如说,你的衣橱里有一身最新正版皇家马德里球衣,还有一双锃亮的阿玛尼皮鞋,它们各自都能让你魅力值立增 50 点(我们姑且不考虑围观群众是巴萨球迷的可能性),但是如果你把它们同时穿上走到街上,能获得魅力值增加100点并且吸引来一群迷妹吗?可能性显然不大。这里,球衣和皮鞋这两个因素的共同效应就不等于它们各自作用之和。或者说,球衣对你形象是否起到正面作用还得取决于你有没有一时脑子短路搭配了一双皮鞋。

知道了怎样算是有交互效应,我们把它翻个个儿就能知道什么情况下没有交互效应:两者的共同效应等于各自单独效应相加,或者一个因素的效应与另一个因素无关

如果你还觉得上面的文字有些抽象,我们不妨用图形的方式来更直观地表现上面的讨论。同时,我们也借助这个机会给大家讲一讲,怎样在论文中用图形表示用于两因素 ANOVA 分析的数据。

别忘了,不管是什么 ANOVA,本质是对数据不同分组的平均值进行比较。除了组数多一点以外,本质上和 t 检验比较两组数据的平均值是没有区别的。理论上来说,我们在《优雅秀出你的t检验,提升Paper逼格!》里讲过的几种用于表示平均值的常用统计图形都可以用在这里,上一集《没听说过多因素ANOVA?那你就可就OUT了!》中比较三位师傅做的两种馅儿的包子的重量的例子里,我们就用了散点图。

但是,由于多因素 ANOVA 往往分组数量比较多, 还可能存在交互效应,如果用散点图的话有时会使图形变得十分繁杂,重点不突出,这时我们可以回到柱状图箱线图,画出各组的平均值和展布(如标准差)。另一种更简单、也更常用的画法,就是直接用单独的点来表示各组的平均值,再加上误差棒,然后再用合适的标记把不同因素区分开来(具体见图 1 下边的部分以及下面的介绍),被很多统计学书籍称为「轮廓图」「剖面图」(profile plot)。我们认为,这两个中文译法并不是特别好。英文 profile 有几个不同的含义,在这里的意思更多是「主要特征」。对于 ANOVA 来说,分组各组平均值是样本最重要、最突出的特征。如果非要生搬硬凑的话,我们可以将其类比成描绘一个人面部轮廓的人像剪影 。

◆◆◆

假设因素 A 有三个分组(就好像上一集的例子中「师傅」这个因素有格格巫、康师傅和王师傅),而因素 B 有两个分组(比如包子馅儿有肉、菜两种)。下图用两种方法画出了一个假想的情形(数据的展布在下面的讨论中不太重要,因此我们省略了误差棒):



图1  用柱状图(上)和轮廓图(下)绘制两因素 ANOVA 结果图

在图 1 的两种画法里,纵轴都遵循一般习惯留给了因变量 y,而横轴用来表示因素 A 的不同分组(或者叫级别或水平)。还剩一个因素 B 怎么办呢?由于是二维图形,两个坐标轴都已经用完了,因此我们就得玩一些别的小花样,用颜色(上图)或点的形状(下图)区分因素 B 的不同分组。

在下边的轮廓图里,我们还用线把来自因素 B 相同分组的点连在一起,使分组更为清晰。顺便说一句,因素 A 和 B 的位置是可以交换的,具体的选择可以根据实际情况(如希望强调的因素、两个因素效应的大小、分组个数多少)灵活选择。

那么现在我们来看一看,根据我们所说的交互效应的两个定义,这个例子里 A、B 两因素之间是否有交互效应?


图 2(同图 1 下)  因素 A、B 有主效应、无交互效应

我们先来看第一条标准,两个因素的共同效应是否为两者单独效应(也就是我们前面说过的「主效应」)的叠加

我们可以从组别 A-1,B-1 中 y 的平均值(左上角蓝色圆圈圈出的点)看起,如果两因素的水平都从 1 变到 2,平均值会发生怎样的变化?因素 A 自己从水平 1 变为 2 会导致 y 的平均值大概降低 2 个单位左右,而因素 B 自己从水平 1 变为 2 也为导致 y 的平均值约降低 2 个单位,因此两者相加就是降低 4 个单位。

那么实际是否如此呢?组别 A-2,B-2 中 y 的平均值是图中红色圆圈圈出的点,和 A-1,B-1 相比,平均值的确是大约降低了 4 个单位,也就是说,当两因素从水平 1 向水平 2 移动时,两者的共同效应的确是各自效应的叠加。按照同样的方法,我们可以检查其他变化方式,在这个例子里也会得到相似的结论。

因此,我们可以得出结论,两个因素之间没有交互效应。

使用第二条标准也可以得出相同的推断,而且更加直观一些。如果一个因素的效应依赖另一个因素,那么当这「另一个」因素处于不同的水平时,前一个因素的 y 平均值的效应将是不同的。也就是说,我们只需要看看因素 A 的效应是否在不同的因素 B 水平下发生变化即可。回到图 2,上下两根折线正好对应了因素 B 的两个水平,而它们是几乎平行的。也就是说,不论因素 B 取哪个水平,因素 A 对 y 平均值的影响都差不多,这再一次表明,两个因素之间没有交互效应。

从这里我们可以得到一个简便的小窍门,要粗略判断两个因素是否有交互效应,在图 2 这种轮廓图中,只需要看一下不在坐标轴上的那个因素所对应的不同水平的折线是否大致平行——如果平行,那么就很可能没有交互效应,反之则表示可能有交互效应(实际数据中,交互效应究竟是否有显著性还取决于各分组数据的发散情况以及样本量)。

如果我们把图 2 中的数据换一种画法,把因素 B 放到横轴上,而用不同的数据点形状和连线来表示因素 A 的水平,也会同样得到近乎平行的三条连线(之所以有三条是因为因素 A 有三个水平),如下面的图 3。因为这两个图是完全等价的,所以在实际应用中,我们只需要观察其中一种画法就可以了。


图 3(数据同图 2)  因素 A、B 有主效应、无交互效应

◆◆◆

我们已经知道了两个因素都有主效应而没有交互效应时轮廓图的特征是几条折线大致平行,那么在有交互效应时会长什么样子呢?不错,相信你已经猜到,如果几条折线有明显的不平行,这就往往暗示着交互效应的存在。下面的图 4 就是一个典型的例子。


图 4 因素 A、B 既有主效应、也有交互效应的一个例子

为什么这里会有交互效应呢?简单地来说,从图 4 可以看到,当因素 B 处在水平 1 时,因素 A 从水平 1 到水平 2 会导致 y 的平均值稍有升高;而当因素 B 在水平 2 时,同样的因素 A 的变化却使 y 的平均值大幅降低。这正符合了交互效应的「一个因素的效应依赖于另一个因素」的定义。如果用之前的方法具体分析因素 A 和因素 B 不同水平间的效应大小,与图 4 中的数据比较,我们同样也会得到「两个因素的共同效应不等于各自单独作用的简单相加」这个等价的结论。

需要注意的是,就和 ANOVA 的主效应一样,交互效应只关心「有没有」,但不关心「什么样」。也就是说,交互作用的存在只表明在「某个地方」出现了两因素共同效应不等于各自效应的叠加,或者说一个因素的效应随另一个因素变化而变化的情况。至于究竟是在哪些分组里存在,哪几个分组之间 y 的平均值存在差异,都是可以变化的。表现在轮廓图上,就是说只要不同的折线不平行(走向不一致),就都有可能有交互效应。下面的图 5 给大家展现了某几种其他的可能。


图 5 因素 A、B 之间存在交互效应的几个示例

因此,当我们发现了显著的交互效应以后,还要使用事后检验(回顾《ANOVA做出了显著性?事儿还没完呢!》)并结合相关图表,才能进一步确定交互效应的具体成因,并确定哪些组的平均值之间存在显著差异,从而对实际问题给出明确的结论。

五年执医 三年模拟

精选每日一题

更多精选题可回顾历史推送文末


题目来源:临床执业医师资格考试往届真题

本期主播:铩羽

回复「统计学」可查看「说人话的统计学」系列合辑,

或点击下方标题可阅读本系列任意文章

>>> 干货 <<<

你真的懂p值吗?

做统计,多少数据才算够?(上)

做统计,多少数据才算够?(下)

提升统计功效,让评审心服口服!

你的科研成果都是真的吗?

见识数据分析的「独孤九剑」

贝叶斯vs频率派:武功到底哪家强?

数据到手了,第一件事先干啥?

算术平均数:简单背后有乾坤

正态分布到底是怎么来的?

想玩转t检验?你得从这一篇看起

就是要实用!t 检验的七十二变

不是正态分布,t 检验还能用吗?

只有15个标本,也能指望 t 检验吗?

样本分布不正态?数据变换来救场!

数据变换的万能钥匙:Box-Cox变换

t 检验用不了?别慌,还有神奇的非参数检验

只讲 p 值,不讲效应大小,都是耍流氓!

找出 t 检验的效应大小,对耍流氓 say no!

用置信区间,就是这么(不)自信!

如何确定 t 检验的置信区间

优雅秀出你的 t 检验,提升Paper逼格!

要做 t 检验,这两口毒奶可喝不得!

要比较三组数据,t 检验还能用吗?

ANOVA在手,多组比较不犯愁

ANOVA的基本招式你掌握了吗?

ANOVA做出了显著性?事儿还没完呢!

听说,成对t检验还有ANOVA进阶版?

重复测量ANOVA:你要知道的事儿都在这里啦

没听说过多因素 ANOVA ?那你就可就 OUT 了!

>>> 自检 <<<

妈妈说答对的童鞋才能中奖

统计学的十个误区,你答对了吗?

>>> 番外篇 <<<

说人话的统计学:一份迟来的邀请

作者:张之昊

编辑:黑草乌叶


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存